بازشناسی قلم های فارسی با استفاده از ماشین بردار پشتیبان

پایان نامه
چکیده

هدف از این پژوهش، بررسی عمل بازشناسی قلم به منظور تشخیص قلم از روی تصاویر اسکن شده از سند ها می باشد. بازشناسی قلم یکی از بخشهای مهمِ سامانه ocr است و هدف از بازشناسی قلم تعیین نوع قلم استفاده شده در متن تایپی است. در این پایان نامه با ترکیب ویژگی های مختلف و استفاده از طبقه بند svm سعی داریم نتایج بازشناسی قلم را بهبود ببخشیم. در این پژوهش از روش های فیلتر گابور، تبدیل موجک، فرکتال چندبُعدی وsrf که یک روش مبتنی بر گرادیان می باشد، برای استخراج ویژگی استفاده و با یکدیگر مقایسه می شوند. روش srf ترکیبی از دو نقاب سوبل و روبرتز می باشد و از اطلاعات دامنه و فاز برای استخراج ویژگی استفاده می کند. همچنین در این روش ویژگی ها به خوبی در جهت های مختلف استخراج می شوند. در استخراج ویژگی به روش موجک، از موجک های مادر متفاوتی از جمله db1 و symlet استفاده و با یکدیگر مقایسه شده اند. روش استخراج ویژگی بعدی مبتنی بر فرکتال است، فرکتال یک روش مفید برای تعیین پیچیدگی های تصاویر است و از روش های گوناگونی از جمله شمارنده جعبه ها و گسترش برای محاسبه بعُد فرکتال در این پژوهش استفاده کرده ایم. یکی دیگر از روش های استفاده شده برای استخراج ویژگی فیلتر گابور است که در گذشته به کرات مورد استفاده قرار گرفته است. عیب اصلی فیلتر گابور محاسبات فراوان و زمان بر آن است در صورتی که روش های دیگر، دارای حجم محاسبات به مراتب کمتری بوده و بسیار سریعتر از فیلتر گابور برای استخراج ویژگی از بافت عمل می کنند. پس از اینکه ویژگی ها با استفاده از روش های مختلف استخراج شدند به وسیله طبقه بندهای svm و mlp قلم ها بازشناسی شده و نتایج حاصل از این دو طبقه بند با یکدیگر مقایسه می شوند. در بین ویژگی های مورد بررسی srf و موجک، سرعت خوبی را داشته و نتایج بهتری را هم ارائه می دهند، از طرف دیگر این دو ویژگی تفاوت های زیادی در نحوه استخراج دارند لذا خطاهای ناشی از این دو ویژگی همبستگی کمی خواهند داشت. با توجه به این موضوع ما این دو ویژگی را با یکدیگر ترکیب کردیم که نتایج آن نسبت به هر دو ویژگی بهبود قابل توجهی یافته است. میانگین نرخ بازشناسی برای روش rsw و با استفاده از طبقه بند svm برابر با 95.58% درصد است که 2.14 درصد از روش srf و حدود 11.25درصد از تبدیل موجک بهتر می باشد.

منابع مشابه

بازشناسی برخط حروف مجزای دست‌نویس فارسی بر اساس تشخیص گروه بدنه اصلی با استفاده از ماشین بردار پشتیبان

In this paper a new method for the online recognition of handwritten Persian characters has been proposed which uses a set of simple features and Support Vector Machine (SVM) as a classifier. The task of preprocessing allows us to equalize feature vectors from different characters. This algorithm is implemented in two steps. In the first step, input character is classified into one of eighteen ...

متن کامل

پیش بینی ژن‏ های بیماری با استفاده از دسته‏ بند تک‌کلاسی ماشین بردار پشتیبان

Abstract: In disease gene identification and classification, users are only interested in classifying one specific class, disease genes, without considering other classes (non-disease genes). This situation is referred to as one-class classification. Existing machine learning-based methods typically use known disease gene as positive training set and unknown genes as negative training set to bu...

متن کامل

مدل‌سازی وضعیت صخره های مرجانی با استفاده از رگرسیون ماشین بردار پشتیبان و اعمال شاخص‌های طیفی

از منظر تنوع زیستی، جزایر مرجانی مانند جنگل‌های استوایی، متنوع ترین اکوسیستم‌های جهان و شاخصی از سلامت اکوسیستم محسوب می‌شوند اما اکثر این جزایر به دلیل تحولات توریستی و نیز تأثیرات تغییر آب‌وهوا رو به نابودی‌اند.توانایی شناسایی و ارزیابی سلامت مرجان‌ها با استفاده از تصاویر ماهواره‌ای شیوه‌ای مقرون‌به‌صرفه و موثر است. با توجه به اثرگذاری دمای سطح آب بر روی سلامت و توزیع رجان‌ها، با استفاده از ا...

متن کامل

بازشناسی چهره با استفاده از آنالیز تفکیک خطی بر پایه موجک‌های هار و گابور و ماشین بردار پشتیبان

در این مقاله، پس از انجام مطالعه‌ای در مباحث الکترونیک، پردازش تصویر، بینایی ماشین، بازشناسی چهره، فیلترینگ، تبدیل موجک، آنالیز تفکیک خطی و ماشین بردار پشتیبان، روش جدیدی برای بازشناسی چهره، معرفی و پیشنهاد شده است. روند کلی این روش به‌صورت زیر است: ابتدا تعدادی تصویر از چهره اشخاص، که در این مقاله از پایگاه داده‌های FERET برگرفته شده است؛ به‌عنوان بانک اطلاعاتی برای بازشناسی چهره، وارد سیستم م...

متن کامل

کاربرد ماشین بردار پشتیبان در تفکیک زون های دگرسانی هیدروترمال با استفاده از سنجنده آستر

در این پژوهش با استفاده از سنجنده آستر تلاش شده است کاربرد الگوریتم ماشین بردار پشتیبان در تفکیک دگرسانی های هیدروترمال ذخایر مس پورفیری مورد مطالعه قرار گیرد. برای آموزش این الگوریتم در مجموع 2204 پیکسل از مناطق کانی سازی شده انتخاب گردید. باندهای 4، 6، 7 و 8 سنجنده آستر برای شناسایی دگرسانی های فیلیک و آرژیلیک و 9 باند محدوده ی مرئی و مادون قرمز نزدیک برای شناسایی دگرسانی پروپیلیتیک به عنوان ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023